맨위로가기

기울기 (벡터)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

기울기(Gradient)는 스칼라 함수 f(x)에 대한 나블라 연산자를 이용한 벡터 미분 연산으로, 함수의 각 성분에 대한 편미분으로 구성된 열벡터이다. 3차원 데카르트 좌표계, 원통 좌표계, 구면 좌표계 등 다양한 좌표계에서 기울기를 표현할 수 있으며, 등위선과 직교하는 성질을 갖는다. 기울기는 함수가 가장 가파르게 상승하는 방향을 나타내며, 방향 도함수를 최대화하는 방향과 일치한다. 또한, 기울기는 전미분과 밀접한 관련이 있으며, 야코비 행렬과 프레셰 도함수로 일반화될 수 있다.

더 읽어볼만한 페이지

  • 미분의 일반화 - 야코비 행렬
    야코비 행렬은 열린 집합 U에서 정의된 함수 f의 각 성분 편도함수를 요소로 가지는 행렬이며, 함수가 미분 가능할 때 전미분을 나타내고, n=m일 경우 행렬식은 함수의 동작에 대한 정보를 제공하며 다양한 분야에 응용된다.
  • 미분의 일반화 - 미분 (주요 부분)
    미분은 함수의 변화율을 나타내는 수학적 개념으로, 독립 변수의 변화에 따른 종속 변수의 순간적인 변화를 선형 함수로 나타내며, 선형 근사, 오차 추정, 미분 방정식 해결 등 다양한 분야에 응용된다.
  • 미분 연산자 - 델 (연산자)
    델 연산자는 3차원 유클리드 공간에서 편미분 연산자를 항으로 하는 벡터로 정의되며, 기울기, 발산, 회전, 라플라시안 등 다양한 연산을 표현하는 데 사용되며 전자기학, 유체역학, 양자역학 등 다양한 분야에 응용된다.
  • 미분 연산자 - 라플라스 연산자
    라플라스 연산자는 준 리만 다양체 위의 매끄러운 벡터 다발에서 정의되는 2차 미분 연산자로, 물리학과 수학에서 정의에 차이가 있을 수 있으며, 기울기, 음악 동형, 발산의 합성, 콤팩트 리만 다양체 위의 함수에 대한 고윳값, 합동 변환과의 가환성, 확산 이론 등 다양한 특징과 응용을 가진다.
  • 수학 사이드바 - 추론 규칙
    추론 규칙은 전제가 참일 때 결론이 필연적으로 참임을 보이는 논리적 도출 과정을 형식적으로 표현한 규칙으로, 다양한 유형이 존재하며 명제 논리와 술어 논리에서 기본적인 추론을 수행하는 데 사용되고, 형식 체계의 핵심 요소이다.
  • 수학 사이드바 - 벡터 공간
    벡터 공간은 체 위의 가군으로 정의되는 대수적 구조로, 벡터 덧셈과 스칼라 곱셈 연산을 가지며 특정 공리들을 만족하고, 기저, 차원, 선형 사상 등의 개념을 통해 수학과 물리학 등 다양한 분야에서 활용된다.
기울기 (벡터)
개요
유형다변수 함수의 미분
분야미적분학, 다변수 미적분학
표기법∇(f), grad f
관련 개념방향 미분, 미분, 야코비 행렬, 헤세 행렬
정의
정의함수 값의 가장 가파른 증가 방향을 나타내는 벡터
유클리드 공간에서 정의유클리드 공간에서 스칼라 값 함수 f의 기울기는 각 점에 대해 다음과 같은 벡터를 정의함: ∇f = (∂f/∂x₁, ..., ∂f/∂xₙ)
함수f : ℝⁿ → ℝ
미분 가능성 조건모든 편미분이 존재하고 연속이어야 함
성질
방향 미분과의 관계기울기는 방향 미분을 최대화하는 방향을 나타냄
직교성기울기는 함수 등고선에 직교함
미분과의 관계기울기는 함수의 미분과 관련됨 (미분은 공간쌍대 벡터로 해석됨)
응용
최적화최적화 문제에서 함수가 증가하는 방향을 찾는 데 사용됨
경사 하강법기울기는 경사 하강법과 같은 최적화 알고리즘에 핵심적으로 활용됨
머신 러닝인공 신경망 학습의 역전파 과정에서 중요한 역할 수행
물리학전위 이론 및 기타 분야에서 폭넓게 응용됨
추가 정보
주의사항기울기는 미분가능 함수에 대해서만 정의됨.

2. 정의

스칼라 함수 f의 기울기는 \boldsymbol{\nabla} f로 표현하며, \nabla 기호는 벡터 미분 연산자로 나블라(nabla) 혹은 델(del)연산자라고 부른다. 기울기는 f의 각 성분의 편미분으로 구성된 벡터로 정의되며, 다음과 같이 표시한다.

: \boldsymbol{\nabla} f = \left(\frac{\partial f}{\partial x_1 }, \dots, \frac{\partial f}{\partial x_n } \right)

3차원 직교 좌표계에서 함수 f(x,y,z)= \ 2x+3y^2-\sin(z)의 기울기는 다음과 같다.

:\boldsymbol{\nabla} f= \begin{pmatrix}

{\frac{\partial f}{\partial x}},

{\frac{\partial f}{\partial y}},

{\frac{\partial f}{\partial z}}

\end{pmatrix} =

\begin{pmatrix}

{2},

{6y},

{-\cos(z)}

\end{pmatrix}

함수 의 기울기를 함수의 의사색상 그림 위에 화살표로 표시했습니다.


기울기는 주어진 점에서 함수 값이 가장 빠르게 증가하는 방향과 그 증가율을 나타낸다. 예를 들어, 온도가 스칼라장 로 주어지는 방에서 각 지점 의 기울기는 온도가 가장 빠르게 상승하는 방향을 가리키며, 기울기의 크기는 그 방향에서 온도가 얼마나 빨리 상승하는지를 나타낸다.

함수 의 기울기를 아래 평면에 투영된 벡터장으로 나타낸 그림.


기울기는 내적을 통해 다른 방향으로의 변화율도 측정할 수 있다. 예를 들어, 언덕의 가장 가파른 경사가 40%일 때, 언덕 위로 직접 올라가는 도로의 경사는 40%이지만, 비스듬히 올라가는 도로의 경사는 더 완만하다. 도로가 언덕 위 방향과 60° 각도를 이룬다면, 도로를 따라가는 경사는 기울기 벡터와 도로를 따라가는 단위 벡터 사이의 내적, 즉 40%에 60°의 코사인을 곱한 20%가 된다.

2. 1. 다양한 좌표계에서의 기울기

직교 좌표계에서 기울기는 다음과 같이 주어진다.

\nabla f = \frac{\partial f}{\partial x} \mathbf{i} + \frac{\partial f}{\partial y} \mathbf{j} + \frac{\partial f}{\partial z} \mathbf{k},

여기서 \mathbf{i}, \mathbf{j}, \mathbf{k}는 각각 x, y, z 좌표 방향의 표준 단위 벡터이다. 예를 들어, 함수

f(x,y,z)= 2x+3y^2-\sin(z)

의 기울기는

\nabla f(x, y, z) = 2\mathbf{i}+ 6y\mathbf{j} -\cos(z)\mathbf{k}

또는

\nabla f(x, y, z) =

\begin{bmatrix}

2 \\

6y \\

  • \cos z

\end{bmatrix}.



이다.

원통좌표계에서 기울기는 다음과 같이 주어진다.[6]

\nabla f(\rho, \varphi, z) = \frac{\partial f}{\partial \rho}\mathbf{e}_\rho + \frac{1}{\rho}\frac{\partial f}{\partial \varphi}\mathbf{e}_\varphi + \frac{\partial f}{\partial z}\mathbf{e}_z,

여기서 \rho는 축 방향 거리, \varphi방위각, z는 축 좌표이고, \mathbf{e}_\rho, \mathbf{e}_\varphi, \mathbf{e}_z는 좌표 방향을 따라 향하는 단위 벡터이다.

구면좌표계에서 기울기는 다음과 같이 주어진다.[6]

\nabla f(r, \theta, \varphi) = \frac{\partial f}{\partial r}\mathbf{e}_r + \frac{1}{r}\frac{\partial f}{\partial \theta}\mathbf{e}_\theta + \frac{1}{r \sin\theta}\frac{\partial f}{\partial \varphi}\mathbf{e}_\varphi,

여기서 r은 반지름 거리, \varphi는 방위각, \theta는 극각이고, \mathbf{e}_r, \mathbf{e}_\theta, \mathbf{e}_\varphi는 좌표 방향을 가리키는 국소 단위 벡터(즉, 정규화된 공변 기저)이다.

다른 직교좌표계에서의 기울기에 대해서는 직교좌표계(3차원 미분 연산자)를 참조하라.

일반적인 곡선좌표계의 경우, 좌표는 x^1, \dots, x^i, \dots, x^n로 나타낼 수 있으며, 여기서 n은 정의역의 차원 수이다. 여기서 위첨자는 좌표 또는 성분 목록에서의 위치를 나타낸다. 지표 변수 i는 임의의 원소 x^i를 가리킨다. 아인슈타인 표기법을 사용하면 기울기는 다음과 같이 쓸 수 있다.

\nabla f = \frac{\partial f}{\partial x^{i}}g^{ij} \mathbf{e}_j

여기서 \mathbf{e}_i = \partial \mathbf{x}/\partial x^i\mathbf{e}^i = \mathrm{d}x^i는 각각 정규화되지 않은 국소 공변 기저와 반공변 기저를 나타내며, g^{ij}는 역 메트릭 텐서이고, 아인슈타인 합 규약에 따라 ''i''와 ''j''에 대한 합을 의미한다.

좌표가 직교좌표계일 경우, 정규화된 기저를 사용하여 축척 인자(또는 라메 계수)를 통해 기울기를 표현할 수 있다.

3. 성질

기울기는 등위선과 직교한다.[4][5] 함수값이 가장 크게 증가하는 방향을 가리킨다. 기울기와 단위 벡터의 내적은 해당 방향으로의 방향 도함수를 나타낸다.

350px


예를 들어 방안의 온도 분포가 스칼라장 로 주어지는 방을 생각해 보자. 각 지점 에서의 온도는 이다. 방의 각 지점에서 해당 지점의 의 기울기는 온도가 가장 빠르게 상승하는 방향을 나타낸다. 기울기의 크기는 그 방향에서 온도가 얼마나 빨리 상승하는지를 나타낸다.

다른 예시로, 지점 에서 해수면 위의 높이가 인 표면을 생각할 때, 어떤 지점에서 의 기울기는 그 지점에서 가장 가파른 기울기 방향을 가리키는 평면 벡터이다. 그 지점에서 경사의 가파른 정도는 기울기 벡터의 크기로 주어진다.

기울기는 내적을 통해 스칼라장이 다른 방향으로 어떻게 변하는지 측정하는 데에도 사용할 수 있다. 예를 들어 언덕의 가장 가파른 경사가 40%라고 가정하면, 직접 언덕 위로 올라가는 도로의 경사는 40%이지만, 언덕 주변으로 비스듬히 올라가는 도로의 경사는 더 완만할 것이다.

기울기 벡터장은 보존 벡터장이며, 선적분 값은 경로에 무관하고 시작점과 끝점에만 의존한다. (기울기 정리)[8]

4. 수학적 해석

기울기는 전미분과 밀접한 관련이 있으며, 서로 전치행렬(쌍대) 관계이다. 미분과의 관계에서 설명하듯이, 기울기와 전미분은 같은 성분을 가지지만 서로 다른 수학적 객체를 나타낸다.

기울기는 함수의 선형 근사에 사용될 수 있다. 예를 들어, 유클리드 공간 \R^n에서 \R로의 함수 f의 임의의 점 x_0에서의 기울기는 fx_0에서의 최적 선형 근사를 특징짓는다. 즉, x_0에 가까운 x에 대해 다음과 같은 선형 근사식을 얻을 수 있다.

: f(x) \approx f(x_0) + (\nabla f)_{x_0}\cdot(x-x_0)

여기서 (\nabla f)_{x_0}x_0에서의 f의 기울기이며, 점은 \R^n에서의 내적이다. 이 식은 fx_0에서의 다변수 테일러 급수 전개의 처음 두 항을 취한 것과 같다.

기울기는 프레셰 도함수의 특수한 경우이다. 함수 f가 프레셰 미분 가능하면, f의 전미분은 f의 프레셰 도함수이며, 따라서 \nabla fU에서 공간 \R^n으로의 사상으로 다음을 만족한다.

:\lim_{h\to 0} \frac

{\|h\|} = 0

여기서 점은 내적이다.

결과적으로, 기울기는 일반적인 미분이 갖는 미분 법칙(선형성, 곱의 법칙, 연쇄 법칙)을 만족한다.

4. 1. 미분과의 관계

스칼라 함수 f(x)의 기울기는 \boldsymbol{\nabla} f로 표현하며, 여기서 \nabla 기호는 벡터 미분 연산자로 나블라(nabla) 혹은 델(del)연산자라고 불린다. 기울기는 f의 각 성분의 편미분으로 구성된 열벡터로 정의된다.

기울기는 전미분(전미분) df와 밀접한 관련이 있으며, 이 둘은 서로 전치행렬(쌍대) 관계에 있다. \R^n의 벡터를 열벡터로, 코벡터(선형 사상 \R^n \to \R)를 행벡터로 나타내는 관례를 사용하면, 기울기 \nabla f와 미분 df는 각각 열벡터와 행벡터로 표현되며, 같은 성분을 가지지만 서로 전치 관계에 있다.

:\nabla f(p) = \begin{bmatrix}\frac{\partial f}{\partial x_1}(p) \\ \vdots \\ \frac{\partial f}{\partial x_n}(p) \end{bmatrix} ;

:df_p = \begin{bmatrix}\frac{\partial f}{\partial x_1}(p) & \cdots & \frac{\partial f}{\partial x_n}(p) \end{bmatrix} .

이 둘은 같은 성분을 가지지만, 서로 다른 종류의 수학적 객체를 나타낸다. 각 점에서 미분은 코탄젠트 벡터, 즉 선형 형식(또는 코벡터)이며, (벡터) 입력의 주어진 무한소 변화에 대한 (스칼라) 출력의 변화량을 나타낸다. 반면에 각 점에서 기울기는 탄젠트 벡터이며, (벡터) 입력의 무한소 변화를 나타낸다.

계산적으로, 주어진 탄젠트 벡터가 있으면, 그 벡터는 미분(행렬로서)과 곱해질 수 있으며, 이는 기울기와의 내적을 취하는 것과 같다.

미분 가능한 함수

:f : \R^n \to \R

의 점 x\R^n 에서의 최적 선형 근사는 \R^n 에서 \R 로의 선형 사상이며, x 에서 f 의 미분 또는 전미분이라고 한다.

기울기는 다음 공식을 통해 미분과 관련된다.

:(\nabla f)_x\cdot v = df_x(v)

여기서 v\R^n 이고, \cdot 는 내적이다. 벡터와 기울기의 내적을 취하는 것은 벡터를 따라 방향 도함수를 취하는 것과 같다.

\R^n 에 표준 유클리드 메트릭을 가정하면, 기울기는 다음과 같은 대응하는 열벡터이다.

:(\nabla f)_i = df^\mathsf{T}_i.

함수에 대한 최적의 선형 근사는 도함수가 아닌 기울기를 이용하여 나타낼 수 있다. 유클리드 공간 \R^n에서 \R로의 함수 f\R^n 내 임의의 특정 점 x_0에서의 기울기는 x_0에서 f에 대한 최적의 선형 근사를 특징짓는다. 근사는 다음과 같다.

:f(x) \approx f(x_0) + (\nabla f)_{x_0}\cdot(x-x_0)

xx_0에 가까울 때, 여기서 (\nabla f)_{x_0}x_0에서 계산된 f의 기울기이고, 점은 \R^n에서의 내적을 나타낸다. 이 방정식은 x_0에서 f의 다변수 테일러 급수 전개의 처음 두 항과 동일하다.

5. 일반화

야코비 행렬은 여러 변수의 벡터값 함수와 유클리드 공간 또는 더 일반적으로 다양체 사이의 미분 가능 함수에 대한 기울기의 일반화이다.[9][10] 바나흐 공간 사이의 함수에 대한 추가적인 일반화는 프레셰 도함수이다.

f : \mathbb{R}^n \to \mathbb{R}^m 와 같이 각 1계 편도함수가 \mathbb{R}^n에서 존재하는 함수를 가정하자. 그러면 f의 야코비 행렬은 m \times n 행렬로 정의되며, \mathbf{J}_\mathbb{f}(\mathbb{x}) 또는 간단히 \mathbf{J}로 표기한다. (i, j)번째 항목은 \mathbf J_{ij} = {\partial f_i} / {\partial x_j}이다. 명시적으로

\mathbf J = \begin{bmatrix}

\dfrac{\partial \mathbf{f}}{\partial x_1} & \cdots & \dfrac{\partial \mathbf{f}}{\partial x_n} \end{bmatrix}

= \begin{bmatrix}

\nabla^\mathsf{T} f_1 \\

\vdots \\

\nabla^\mathsf{T} f_m

\end{bmatrix}

= \begin{bmatrix}

\dfrac{\partial f_1}{\partial x_1} & \cdots & \dfrac{\partial f_1}{\partial x_n}\\

\vdots & \ddots & \vdots\\

\dfrac{\partial f_m}{\partial x_1} & \cdots & \dfrac{\partial f_m}{\partial x_n} \end{bmatrix}.

벡터장의 전미분은 벡터에서 벡터로의 선형 사상이므로 텐서 양이다.

직교 좌표계에서 벡터장 \mathbf{f} = (f^1, f^2, f^3)의 기울기는 다음과 같이 정의된다.

\nabla \mathbf{f}=g^{jk}\frac{\partial f^i}{\partial x^j} \mathbf{e}_i \otimes \mathbf{e}_k,

(아인슈타인 합 규약을 사용하고 벡터 \mathbf{e}_i\mathbf{e}_k텐서곱은 (2,0)형의 다이어드 텐서이다). 전반적으로 이 식은 야코비 행렬의 전치와 같다.

\frac{\partial f^i}{\partial x^j} = \frac{\partial (f^1,f^2,f^3)}{\partial (x^1,x^2,x^3)}.

곡선 좌표계 또는 더 일반적으로 곡면 다양체에서 기울기는 크리스토펠 기호를 포함한다.

\nabla \mathbf{f}=g^{jk}\left(\frac{\partial f^i}{\partial x^j}+{\Gamma^i}_{jl}f^l\right) \mathbf{e}_i \otimes \mathbf{e}_k,

여기서 g^{jk}는 역 계량 텐서의 성분이고 \mathbf{e}_i는 좌표 기저 벡터이다.

더 불변적으로 표현하면, 벡터장 \mathbf{f}의 기울기는 레비-치비타 연결과 계량 텐서로 정의될 수 있다.[11]

\nabla^a f^b = g^{ac} \nabla_c f^b ,

여기서 \nabla_c는 연결이다.

리만 다양체 (M, g) 상의 임의의 매끄러운 함수 f에 대해, f의 기울기는 임의의 벡터장 X에 대해 다음을 만족하는 벡터장 \nabla f이다.

g(\nabla f, X) = \partial_X f,

즉,

g_x\big((\nabla f)_x, X_x \big) = (\partial_X f) (x),

여기서 g_x( , )는 메트릭 g에 의해 정의된 x에서의 접벡터의 내적을 나타내고, \partial_X f는 임의의 점 x \in Mx에서 평가된 X 방향의 f의 방향 도함수에 대응시키는 함수이다. 다시 말해, M의 열린 부분집합에서 \mathbb{R}^n의 열린 부분집합으로의 좌표 차트 \varphi에서, (\partial_X f)(x)는 다음과 같이 주어진다.

\sum_{j=1}^n X^{j} \big(\varphi(x)\big) \frac{\partial}{\partial x_{j}}(f \circ \varphi^{-1}) \Bigg|_{\varphi(x)},

여기서 X^j는 이 좌표 차트에서 Xj번째 성분을 나타낸다.

따라서, 기울기의 국소적 형태는 다음과 같은 형태를 취한다.

\nabla f = g^{ik} \frac{\partial f}{\partial x^k} {\textbf e}_i .

M = \mathbb{R}^n인 경우를 일반화하면, 함수의 기울기는 외미분과 관련이 있다. 왜냐하면

(\partial_X f) (x) = (df)_x(X_x) .

좀 더 정확히 말하면, 기울기 \nabla f는 메트릭 g에 의해 정의된 뮤지컬 아이소모피즘

\sharp=\sharp^g\colon T^*M\to TM

("sharp"라고 부름)을 사용하여 미분 1-형식 df에 관련된 벡터장이다. \mathbb{R}^n 상의 함수의 외미분과 기울기 사이의 관계는 메트릭이 내적에 의해 주어지는 평평한 메트릭인 특수한 경우이다.

참조

[1] 논문 (여러 저자의 논문 인용)
[2] 논문 (여러 저자의 논문 인용)
[3] 웹사이트 Non-differentiable functions must have discontinuous partial derivatives - Math Insight https://mathinsight.[...] 2023-10-21
[4] 논문 (저자명 미상)
[5] 논문 (저자명 미상)
[6] 논문 (저자명 미상)
[7] 논문 (저자명 미상)
[8] 서적 Mathematik https://doi.org/10.1[...] Springer Spektrum Berlin
[9] 논문 (저자명 미상)
[10] 논문 (저자명 미상)
[11] 논문 (저자명 미상)
[12] 웹사이트 Vector Calculus: Understanding the Gradient – BetterExplained https://betterexplai[...] 2024-08-22



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com